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GATCATTAAATAAATCAAGGTTAGTTAGCTTGAAAGATATAAATATATTCCAAAATTCCA 
61 

AAAAGTAATTGGCATAGTGACAAAAACTATTGCTCCCCTGCTTTAGAAATAATTTATTTT 
121 

TAATTTAATATTAAAAGTAAACTGAAGAATCTAGTTATATTTAAAAAGTAAAGGTTGCAT 
181 

TTTAACTAAATTATGTTAAACTACTGTTATGCGATGAGTCGATATGTGGTTTTACCACTA 
241 

TTGCGCAGGGAGATTATAAACGCAGGAGCGGATCTTGATAAGTTGTGTGAACCTTCTTGT 
301 

CACACTTGAAAAGGTGCCCTTAGCTTACTACTACTTGTAATTTCTTACAAATTGTGGTAA 
361 

GTAGCTGAAAAGCAAAAAAGAAAGAACCAGTTTGGTTCTTTCTTTTTTGCATAAATAAGT 
421 

CACAATTTCCTTCTTAAAATTATGTCTTTACTTAACTTTAATTGAATATGCTACCATCAC 
481 

ATTCTTTGTAAAATTTTTAAATAATCTAGTTTCTGATGGTTTAGATGAAGTATTAAAAAT 
541 

ATACTATTACCTCATTGTAAATCTTAATGTTAGTATGACTATCTATCATGCTTTATAATA 
601 

TTAAAGGAAAATTTAAAAATATCATGTTTTAGATATCAACTATTTAATTTTAAACATACA 
661 

AATTAATAATAAATTGCAACTAAATAATAAATTATCTTGACATAACTTATAAAATGTTTT 
721 

AATATATAATCTAAATAAAAGTAATAATAAAATGACTTTTAAAATTTAAAAAAAGT AAGG 
781 RBS 
AGAAAATTAATTGTTCAATAAAATAGGTTTTAGAACTTGGAAATCAGGAAAGCTTTGGCT 
841 MFNKIGFRTWKSGKLWL 
TTATATGGGAGTGCTAGGATCAACTATTATTTTAGGATCAAGTCCTGTATCTGCTATGGA 
YMGVLGSTIILGSSPVSAMD 
901 | ► Repeat I (SEQ ID 21) 

TAGTGTTGGAAATCAAAGTCAGGGCAATGTTTTAGAGCGTCGTCAACGTGATGCAGAAAA 
SVGNQSQGNVLERRQRDAEN 

961 ► Repeat 2 (SEQ ID 22) Repeat 3 (SEQ ID 23) ,— 

CAGAAGCCAAGGCAATGTTCTAGAGCGTCGTCAACGCGATGTTGAGAATAAGAGCCAAGG 
RSQGNVLERRQRDVENKSQG 
1021 Repeat 4 (SEQ ID 24) | ^ 
CAATGTTTTAGAGCGTCGTCAACGTGATGCGGAAAACAAGAGCCAAGGCAATGTTTTAGA 
NVLERRQRDAENKSQGNVLE 
1081 Repeat 5 (SEQ ID 25) | ► 

GCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGGCAATGTTCTAGAGCGTCGTCAACG 
RRQRDAENRSQGNVLERRQR 
1141 Repeat 6 (SEQ ID 26) | ► 

TGATGCAGAAAACAGAAGCCAAGGCAATGTTCTAGAGCGTCGTCAACGCGATGCAGAAAA 
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DAENRSQGNVLERRQRDAEN 
1201 fc- Repeat 7 (SEQ ID 27) Repeat 8 (SEQ ID 28) ^ 

cagaagccaaEgtaatgttctagagcgtcgtcaacgtgatgcagaaaacagaagccaagg 
rsqgnvlerrqrdaenrsqg 

1261 Repeat 9 (SEQ ID 29) | ► 

TAATGTTCTAGAGCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGGTAATGTTCTAGA 
NVLERRQRDAENRSQGNVLE 
1321 Repeat 1 0 (SEQ ID 30) | ► 

GCGTCGTCAACGCGATGTTGAGAATAAGAGCCAAGGCAATGTTTTAGAGCGTCGTCAACG 
RRQRDVENKSQGNVLERRQR 
1381 Repeat 11 (SEQ ID 31) i ► 

TGATGCGGAAAACAAGAGCCAAGGCAATGTTTTAGAGCGTCGTCAACGTGATGCAGAAAA 

DAENKSQGNVLERRQRDAEN 
1441 | ► Repeat 12 (SEQ ID 32) Repeat 13 (SEQ ID 33) | ► 

CAGAAGCCAAGGCAATGTTTTAGAGCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGG 
RSQGNVLERRQRDAENRSQG 

1501 Repeat 14 (SEQ ID 34) , ^ 

CAATGTTCTAGAGCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGGCAATGTTCTAGA 
NVLERRQRDAENRSQGNVLE 

1561 Repeat 15 (SEQ ID 35) | ► 

GCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGGCAATGTTCTAGAGCGTCGTCAACG 
RRQRDAENRSQGNVLERRQR 
1621 Reoeat 16 (SEO ID 36) I ► 

CGATGCAGAAAACAGAAGCCAAGGTAATGTTCTAGAGCGTCGTCAACGTGATGCAGAAAA 
DAENRSQGNVLERRQRDAEN 
1681 | ^ Repeat 17 (SEQ ID 37) Repeat 18 (SEQ ID 38) 

CAGAAGCCAAGGCAATGTTTTAGAGCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGG 
RSQGNVLERRQRDAENRS QG 

1741 Reoeat 19 fSEO ID 39) | ► 

CAATGTTTTAGAGCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGGCAATGTTTTAGA 
NVLERRQRDAENRSQGNVLE 
1801 

GCGTCGTCAACGTGATGCGGAAAACAAGAGCCAAGTAGGTCAACTTATAGGGAAAAATCC 
RRQRDAENKSQVGQLI GKNP 
1861 

ACTTCTTTCAAAGTCAATTATATCTAGAGAAAATAATCACTCGAGTCAAGGTGACTCTAA 
LLSKSIISRENNH SSQGDSN 
1921 

CAAACAGTCATTCTCTAAAAAAGTATCTCAGGTTACTAATGTAGCTAATAGACCGATGTT 
KQSFSKKVSQVTNVANRPML 
1981 

AACTAATAATTCTAGAACAATTTCAGTGATAAATAAATTACCTAAAACAGGTGATGATCA 
TNNSRTI SVINK L P K T G D D Q 
2041 
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AAATGTCATTTTTAAACTTGTAGGTTTTGGTTTAATTTTGTTAACAAGTCGCTGCGGTTT 
NVIFKLVGFGLILLTSRCGL 
2101 

GAGACGCAATGAAAATTAAGTATAATCAATCATTTAGTAACTATATATAATGATATATGC 

R R N E N * 
2161 . 

AATCAATAAAAAGGAATCGGATACGAGATTCCTTTTTATAATTAGGTTGGTTAGGGTGAC 
2221 

TTTTTTCATTTGGCTATTCTTGAAAGTTTATAAAAATGTAGTTATAATAGTCACATTAAA 
2281 

ATGTTTTGAAAATATTGATGAACAACATCAACAAATAGAGGTCATTATATGGGATATACC 
2341 

GTTGCTATCGTAGGTGCTACAGGTGCCGTAGGAACACAAATGATTCGTCAATTAGAACAA 
2401 

TCGAATTTACCAATAGAACAAGTGAAACTTTTATCATCAAGTCGCTCAGCAGGTAAAATT 
2461 

TTACATTTTAAAGATGAGGCTATACGTGTTGAAGAGACAACAAAAGAATCATTTTACGAT 
2521 

GTTGATATTGCCTTGTTTTCAGCTGGTGGATC 
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GCATAAATAAGTCACAATTTCCTTCTTAAAATTATGTCTTTACTTAACTTTAATTGAATA 
61 

TGCTACCATCACATTCTTTGTAAAATTTTTAAATAATCTAGTTTCTGATGGTTTAGATGA 
121 

AGTATTAAAAATATACTATTACCTCATTGTAAATCTTAATGTTAGTATGACTATCTATCA 
181 

TGCTTTATAATATTAAAGGAAAATTTAAAAATATCATGTTTTAGATATCAACTATTTAAT 
241 

TTTAAACATACAAATTAATAATAAATTGCAACTAAATAATAAATTATCTTGACATAACTT 
301 

ATAAAATGTTTTAATATATAATCTAAATAAAAGTAATAATAAAATGACTTTTAAAATTTA 
361 

AAAAAAGT AAGGAGAA AATTAATTGTTCAATAAAATAGGTTTTAGAACTTGGAAATCAGG 
421 RBS MFNKIGFRTWKSG 
AAAGCTTTGGCTTTATATGGGAGTGCTAGGATCAACTATTATTTTAGGATCAAGTTCTGT 
KLWLYMGVLGSTIILGSSSV 
481 Repeat 1 (SEQ ID 40) | ^ 

ATCTGCTATGGATAGTGTTGGAAATCAAAGTCAGGGCAATGTTTTAGAGCGTCGTCAACG 

SAMDSVGNQSQGNVLERRQR 
Repeat2 (SEQ ID 41) | ^ 

CGATGCAGAAAACAGAAGCCAAGGCAATGTTTTAGAGCGTCGTCAACGTGATGCAGAAAA 

DAENRSQGNVLERRQRDAEN 
g Q1 |— ► Repeat 3 (SEQ ID 42) Repeat 4 (SEQ ID 43) 

CAGAAGCCAAGGCAATGTTTTAGAGCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGG 
RSQGNVLERRQRDAENRSQG 

661 Repeats (SEQ ID 44) | 

TAATGTTCTAGAGCGTCGTCAACGCGATGTTGAAAATAAAAGCCAAGGCAATGTTTTAGA 

NVLERRQRDVENKSQGNVLE 
7 2 1 Repeat 6 (SEQ ID 45) | »> 

GCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGGTAATGTTCTAGAGCGTCGTCAACG 
RRQRDAENRSQGNVLERRQR 
731 Repeat 7 (SEQ ID 46) | ^ 

CGATGTTGAAAATAAAAGCCAAGGCAATGTTTTAGAGCGTCGTCAACGTGATGCAGAAAA 
DVENKSQGNVLERRQRDAEN 
84 1 | P- Repeat 8 (SEQ ID 47) Repeat 9 (SEQ ID 48) | ^ 

CAGAAGCCAAGGTAATGTTCTAGAGCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGG 
RSQGNVLERRQRDAENRSQG 
901 Repeat 10 (SEQ ID 49) j ► 

CAATGTTTTAGAGCGTCGTCAACGCGATGCAGAAAACAGAAGCCAAGGCAATGTTCTAGA 
NVLERRQRDAENRSQGNVLE 
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961 Repeat 11 (SEQ ID 50) 

GCGTCGTCAACGTGATGCTGAAAACAAAAGCCAAGGCAATGTTTTAGAGCGTCGTCAACG 
RRQRDAENKSQGNVLERRQR 
1021 Repeat 12 (SEQ ID 51) | ► 

TGATGCAGAAAACAGAAGCCAAGGCAATGTTTTAGAGCGTCGTCAACGTGATGCTGAAAA 

DAENRSQGNVLERRQRDAEN 

1081 | ^ Repeat 13 (SEQ ID 52) Repeat 14 (SEQ ID 53) 

CAGAAGCCAAGGCAATGTTTTAGAGCGTCGTCAACGCGATGCAGAAAACAGAAGCCAA 

RSQGNVLERRQRDAENRSQG 
1141 Repeat 15 (SEQ ID 54) | 

TAATGTTCTAGAGCGTCGTCAACGTGATGCGGAAAACAAGAGCCAAGGCAATGTTTTAGA 
N VLERRQRDAENKSQGNVLE 
1201 Repeat 16 (SEQ ID 55) . ► 

GCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGGCAATGTTTTAGAGCGTCGTCAACG 
RRQRDAENRSQGNVLERRQR 
1261 Repeat 17 (SEQ ID 56) | ► 

CGATGTTGAGAATAAGAGCCAAGGCAATGTTTTAGAGCGTCGTCAACGTGATGCGGAAAA 
DVENKSQGNVLERRQRDAEN 
1321 

GAAGAGCCAAGTAGGTCAACTTATAGGGAAAAATCCACTTCTTTCAAAGTCAATTATATC 
KSQVGQLIGKNPLLSKSI IS 
1381 

TAGAGAAAATAATCACTCTAGTCAAGGTGACTCTAACAAACAGTCATTCTCTAAAAAAGT 
RENNHSSQGDSNKQS FSKKV 
1441 

ATCTCAGGTTACTAATGTAGCTAATAGACCGATGTTAACTAATAATTCTAGAACAATTTC 
SQVTN VANRPMLTNNSRTI S 
1501 

AGTGATAAATAAATTACCTAAAACAGGTGATGATCAAAATGTCATTTTTAAACTTGTAGG 
V I N K L P K T G DDQNVI FKLVG 
1561 

TTTTGGTTTAATTTTGTTAACAAGTCGCTGCGGTTTGAGACGCAATGAAAATTAAGTATA 
FGLILLT SRCGLRRNEN* 

1621 ' ^ 

ATCAATCATTTAGTAACTATATATAATGATATATGCAATCAATAAAAAGGAATCGGATAC 



GAGATTCCTTTTTATAATTAGGTTGGTTAGGGTGACTTTTTTCATTTGGCTATTCTTGAA 
1741 1761 1781 

AGTTTATAAAAATGTAGTATAATAGTCACATTAAAATGTTTTGAAAATATTGATGAACAA 
1801 

CATCAACAAATAGAGGTCAT 
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GCATAAATAAGTCACAATTTCCTTCTAAAAATTATGTCTTTACTTAACTTTAATTGAATA 
61 

TGCTACCATCACATTCTTTGTAAAATTTTTAAATAATCTAGTTTCTGATGGTTTAGATGA 
121 

AGTATTAAAAATATACTATTATCTCATTGTAAATCCTAATGTTAGTATGACTATCTATCA 
181 

TGTTTTATAATATTGAAGGAAAATTTAAAAATATCATGTTTTAGATATCAACTATTTAAT 
241 

TTTAAACATACAAATTAATAATAAATTGCAATTAAATAACAAATTACCTTGACATAAATT 
301 

ATAAAATGTTTTAATATATATAATCTAAATAAAAATAATAATAAAATGACTTTTAAAATT 
361 

TAAAAAAAG TAAGGAGAA AATTAATTGTTCAATAAAATAGGTTTTAGAACTTGGAAATCA 
421 RBS MFNKIGFRTWKS 

GGAAAGCTTTGGCTTTATATGGGAGTGCTAGGATCAACTATTATTTTAGGATCAAGTCCT 

GKLWLYMGVLGSTIILGSSP 
481 Repeat 1 (SEQ ID 57) | 

GTATCTGCTATGGATAGTGTTGGAAATCAAAGTCAAGGTAATGTTCTAGAGCGTCGTCAA 

VSAMDSVGNQSQGNVLERRQ 
541 Repeat 2 (SEQ ID 58) ^ ^ 

CGTGATGCGGATAACAAGAGCCAAGGCAATGTTCTAGAACGTCGTCAACGCGATGTAGAA 

RDADNKSQGNVLERRQRDVE 
601 ( ► Repeat 3 (SEQ ID 59) 

AACAGAAGCCAAGGCAATGTTCTAGAGCGTCGTCAACGCGATGCGGATAACAAGAGCCAA 
NRSQGNVLERRQRDADNKSQ 

■ Repeat4 (SEQ ID 60) Repeats (SEQ ID 61) i ► 

GGCAATGTTTTAGAGCGCCGCCAACGCGATGCAGAAAACAAAAGTCAGGGCAATGTTCTA 

GNVLERRQRDAENKS QGNVL 
721 Repeat 6 (SEQ ID 62) j ^ 

GAACGTCGTCAACGTGATGTTGAGAATAAGAGCCAAGGCAATGTTCTAGAGCGTCGCCAA 

ERRQRDVENKSQGNVLERRQ 
781 Repeat 7 (SEQ ID 63) . 

CGTGATGCAGAAAACAAAAGTCAGGGTAATGTTCTAGAGCGTCGTCAACGCGATGCAGAT 
RDAENKSQGNVLERRQRDAD 

841 | ► Repeat 8 (SEQ ID 64) 

AACAAGAGCCAAGGTAATGTTCTAGAACGTCGTCAACGCGATGTGGAAAACAAAAGTCAG 

NKSQGNVLERRQRDVENKSQ 
I ^ Repeat 9 (SEQ ID 65) Repeat 10 (SEQ ID 66) . ^ 

bGCAATGTTCTAGAACGTCGTCAACGTGATGTTGAGAATAAGAGCCAAGGCAATGTTGTA 

GNVLERRQRDVENKSQGNVL 
gg^ Repeat II (SEQ ID 67) | ^- 

GAGCGTCGCCAACGTGATGCAGAAAACAAAAGTCAGGGTAATGTTCTAGAGCGTCGTCAA 
ERRQRDAENKSQGNVLERRQ 
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1021 Repeat 12 (SEQ ID 68) | p. 

CGCGATGCAGATAACAAGAGCCAAGGTAATGTTCTAGAACGTCGTCAACGCGATGTGGAA 

RDADNKSQGNVLERRQRDVE 
1 0 8 1 | ► Re P cat 13 ( SE Q |D 69 ) 

AACAAAAGTCAGGGCAATGTTCTAGAGCGTCGCCAACGTGATGTTGAGAACAAGAGCCAA 

NKSQGNVLERRQRDVENKSQ 
1141 

GTAGGTCAACTTATAGGGAAAAATCCACTTCTTTCAAAGTCAACTATATCTAGAGAAAAT 

VGQLIGKNPLLSKSTI SREN 
1201 

AATCACTCTAGTCAAGGTGACTCTAACAAACAGTCATTCTCTAAAAAAGTATCTCAGGTT 

NHSSQGDSNKQSFSKKVSQV 
1261 

ACTAATGTAGCTAATAGACCAATGTTAACTAATAATTCTAGAACAATTTCAGTGATAAAT 

TNVANRPMLTNNSRTISVIN 
1321 

AAATTACCTAAAACAGGTGATGATCAAAATGTCATTTTTAAACTTGTAGGTTTTGGTTTA 

K L P K T G DDQNVI FKLVGFGL 
1381 

ATTTTGTTAACAAGTCGCTGCGGTTTGAGACGCAATGAAAATTAAGTATAATCAATCATT 
ILLTSRCGLRRNEN* 

1441 » « 

TAGTAACTATTATAATGATATATGCAATCAATAAAAAGGAATCGGATACAAGATTCCTTT 



TTATAATTAGGTTGGTTAGGGTGACTTTTTCATTTGGCTATTCTTGAAAGTTTATAAAAA 
1561 

TGTAGTATAATAGTCACATTAAAATGTTTTGAAAATATTGATGAACAACATCAACAAATA 
1621 

GAGGTCAT 
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GCATAAATAAGTCACCAATTTCCCTTCTTAAAATTATGTCTTTACTTAACTTTAATTGAA 
61 

TATGCTACCATCACATTCTTTGTAAAATTTTTAAATAATCTAGTTTCTGATGGTTTAGAT 
121 

GAAGTATTAAAAATATACTATTACCTCATTGTAAATCTTAATGTTAGTATGACTATCTAT 
181 

CATGCTTTATAATATTAAAGGAAAATTTAAAAATATCATGTTTTAGATATCAACTATTTA 
241 

ATTTTAAACATACAAATTAATAATAAATTGCAACTAAATAATAAATTATCTTGACATAAC 
301 

TTATAAAATGTTTTAATATATAATCTAAATAAAAGTAATAATAAAATGACTTTTAAAATT 
361 

TAAAAAAAGTAAGGAGAAAATTAATTGTTCAATAAAATAGGTTTJAGAACTTGGAAATCA 



421 RBS MFNKIGFRTWKS 

GGAAAGCTTTGGCTTTATATGGGAGTGCTAGGATCAACTATTATTTTAGGATCAAGTCCT 

GKLWLYMGVLGSTIILGSSP 
481 Repeat I (SEQ ID 70) | ^ 

GTATCTGCTATGGATAGTGTTGGAAATCAAAGTCAGGGCAATGTTTTAGAGCGTCGTCAA 

VSAMDSVGNQSQGNVLERRQ 
541 



Repeat 2 (SEQ ID 71) 

CGCGATGCAGAAAACAGAAGCCAAGGTAATGTTCTAGAGCGTCGTCAACGCGATGCAGAA 
RDAENRSQGNVLERRQRDAE 

601 | Repeat 3 (SEQ ID 72) 

AACAGAAGCCAAGGTAATGTTCTAGAGCGTCGTCAACGTGATGCGGAAAACAAGAGCCAA 

NRSQGNVLERRQRDAENKSQ 
661 

GTAGGTCAACTTATAGGGAAAAATCCACTTCTTTCAAAGTCAATTATATCTAGAGAAAAT 

VGQ LIGKNPLLSKSI I SREN 
721 

AATCACTCTAGTCAAGGTGACTCTAACAAACAGTCATTCTCTAAAAAAGTATCTCAGGTT 

NHSSQGDSNKQSFSKKVSQV 
781 

ACTAATGTAGCTAATAGACCGATGTTAACTAATAATTCTAGAACAATTTCAGTGATAAAT 

TNVANRPMLTNNSRTI SVIN 
841 

AAATTACCTAAAACAGGTGATGATCAAAATGTCATTTTTAAACTTGTAGGTTTTGGTTTA 

K L P K T G DDQNVI FKLVGFGL 
901 

ATTTTGTTAACAAGTCGCTGCGGTTTGAGACGCAATGAAAATTAAGTATAATCAATCATT 
ILLTSRCGLRRNEN* 

961 ^ ^ 

TAGTAACTATATATAATGATATATGCAATCAATAAAAAGGAATCGGATACGAGATTCCTT 



TTTATAATTAGGTTGGTTAGGGTGACTTTTTTCATTTGGCTATTCTTGAAAGTTTATAAA 
1081 

AATGTAGTATAATAGTCACATTAAAATGTTTTGAAAATATTGATGAACAACATCAACAAA 
1141 

TAGAGGTCAT 
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GCATAAATAAGTCACAATTTCCTTCTTAAAATTATGTCTTTACTTAACTTTAATTGAATA 
61 

TGCTACCATCACATTCTTTGTAAAATTTTTAAATAATCTAGTTTCTGATGGTTTAGATGA 
121 

AGTATTAAAAATATACTATTACCTCATTGTAAATCTTAATGTTAGTATGACTATCTATCA 
181 

TGCTTTATAATATTAAAGGAAAATTTAAAAATATCATGTTTTAGATATCAACTATTTAAT 
241 

TTTAAACATACAAATTAATAATAAATTGCAACTAAATAATAAATTATCTTGACATAACTT 
301 

ATAAAATGTTTTAATATATAATCTAAATAAAAGTAATAATAAAATGACTTTTAAAATTTA 
361 

AAAAAAGT AAGGAGAA AATTAATTGTTCAATAAAATAGGTTTTAGAACTTGGAAATCAGG 
421 RBS MFNKIGFR T W K S G 
AAAGCTTTGGCTTTATATGGGAGTGCTAGGATCAACTATTATTTTAGGATCAAGTCCTGT 
KLWLYMGVLGSTIILGSSPV 
4 81 Repeat 1 (SEQ ID 73) i »- 

ATCTGCTATGGATAGTGTTGGAAATCAAAGCCAAGGCAATGTTCTAGAGCGTCGTCAACG 

SAMDSVGNQSQGNVLERRQR 
Repeat 2 (SEQ ID 74) | ^> 

CGATGCAGAAAACAGAAGCCAAGGTAATGTTTTAGAACGTCGTCAACGCGATGTTGAGAA 
DAENRSQGNVLERRQRDVEN 
601 | ► Repeat 3 (SEQ ID 75) Repeat 4 (SEQ ID 76) 

CAAGAGCCAAGGTAATGTTTTAGAGCGTCGCCAACGTGATGCGGAAAACAAAAGTCAGGG 
KSQGNVLERRQRDAENKSQG 

661 Repeat 5 (SEQ ID 77) | ^ 

CAATGTTTTAGAGCGTCGTCAACGTGATGCAGAAAACAGAAGCCAAGGTAATGTTCTAGA 
NVLERRQRDAENRSQGNVLE 
721 Repeat 6 (SEQ ID 78) | ^> 

GCGTCGTCAACGCGATGTTGAGAATAAGAGCCAAGGCAATGTTCTAGAGCGTCGTCAACG 
RRQRDVENKSQGNVLERRQR 
781 Repeat 7 (SEQ ID 79) , 

CGATGTTGAGAATAAGAGCCAAGGTAATGTTCTAGAGCGTCGTCAACGCGATGTTGAGAA 
DVENKSQGNVLERRQRDVEN 
841 | ► Repeat 8 (SEQ ID 80) Repeat 9 (SEQ ID 81) 

TAAGAGCCAAGGTAATGTTCTAGAGCGTCGTCAACGTGATGCGGAAAACAAGAGCCAAGG 
KSQGNVLERRQRDAENKSQG 

901 Repeat 10 (SEQ ID 82) . 

CAATGTTCTAGAGCGTCGTCAACGCGATGCAGAAAACAGAAGCCAAGGTAATGTTTTAGA 
NVLERRQRDAENRSQGNVLE 
961 

GCGTCGCCAACATGATGTTGAGAATAAGAGTCAAGTAGGTCAACTTATAGGGAAAAATCC 
RRQHDVENKSQVGQLIGKNP 
1021 

ACTTTTTTCAAAGTCAACTGTATCTAGAGAAAATAATCACTCTAGTCAAGGTGACTCTAA 
LFSKSTVSRENNHSSQGDSN 
1081 
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CAAACAGTCATTCTCTAAAAAAGTATCTCAGGTTACTAATGTAGCTAATAGACCGATGTT 

KQSFSKKVSQVTNVANRPML 
1141 

AACTAATAATTCTAGAACAATTTCAGTGATAAATAAATTACCTAAAACAGGTGATGATCA 
TNNSRTISVINK L P K T G D D Q 
1201 

AAATGTCATTTTTAAACTTGTAGGTTTTGGTTTAATTTTATTAACAAGTCTCTGCGGTTT 

NVIFKLVGFGLILLTSLCGL 
1261 

GAGACGCAATGAAAATTAAGTATAATCAACCATTTAGTAACTATTATAATGATATATGCA 
R R N E N * 



1381 

TTTTTTCATTTGGCTATTCTTGAAAGTTTATAAAAATGTAGTATAATAGTCACATTAAAA 
1441 

TGTTTTGAAAATATTGATGAACAACATCATCAAATAGAGGTCAT 
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GCATAAATAAGTCACAATTTCCTTCTAAAAATTATGTCTTTACTTAACTTTAATTGAATA 
61 

TGCTACCATCACATTCTTTGTAAAATTTTTAAATAACCTAGTTTCTGATGGTTTAGATGA 
121 

AGTATTAAAAATATACTATTATCTCATTGTAAATCCTAATGTTAGTATGACTATCTATCA 
181 

TGTTTTATAATATTGAAGGAAAATTTAAAAATATCATGTTTTAGATATCAACTATTTAAT 
241 

TTTAAACATACAAATTAATAATAAATTGCAATTAAATAACAAATTACCTTGACATAAATT 
301 

ATAAAATGATTTAATATATATAATCTAAATAAAAATAATAATAAAATGACTTTTAAAATT 
361 

TAAAAAAAGT AAGGAGAA AATTAATTGTTCAATAAAATAGGTTTTAGAACTTGGAAATCA 
421 RBS MFNKIGFRTWRS 

GGAAAGCTTTGGCTTTATATGGGAGTGCTAGGATCAACTATTATTTTAGGATCAAGTCCT 
GKLWLYMGVLGSTIILGSSP 

4 ^1 Repeat 1 (SEQ ID 83) r ^ 

GTATCTGCTATGGATAGTGTTGGAAATCAAAGTCAAGGTAATGTTCTAGAGCGTCGCCAA 

VSAMDSVGNQSQGNVLERRQ 
541 Repeat 2 (SEQ ID 84) | 

CGTGATGCGGATAACAAGAGCCAAGGTAATGTTTTAGAGCGTCGCCAACGTGATGCAGAT 
RDADNKSQGNVLERRQRDAD 

3GGCA£ 

NKSQGNVLERRQRDVDNKSQ 
| Repeat 4 (SEQ ID 86) Repeat 5 (SEQ ID 87) | »- 

GGTAACGTTCTAGAGCGTCGCCAACGCGATGCTGATAACAAGAGCCAAGGTAATGTTTTA 
GNVLERRQRDADNKSQGNVL 

721 Repeat 6 (SEQ ID 88) ■ ► 

GAGCGCCGCCAACGCGATGCAGATAACAAAAGTCAAGGTAATGTTCTAGAGCGTCGCCAA 

ERRQRDADNKSQGNVLERRQ 
781 Repeat 7 (SEQ ID 89) | ► 

CGCGATGTTGATAACAAGAGCCAGGGTAATGTTTTAGAGCGTCGCCAACGCGATGCAGAT 

RDVDNKSQGNVLERRQRDAD 
841 . ^. Repeat 8 (SEQ ID 90) 

AACAAAAGTCAGGGTAATGTTTTAGAGCGTCGCCAACGCGATGTTGATAACAAAAGCCAA 

NKSQGNVLERRQRDVDNKSQ 
| Repeat 9 (SEQ ID 91) Repeat 10 (SEQ ID 92) | ^ 

GGTAATGTTTTAGAGCGTCGCCAACGTGATGCTGATAACAAAAGTCAGGGCAATGTTCTA 

GNVLERRQRDADNKSQGNVL 

961 Repeat 11 (SEQ ID 93) | 

GAGCGTCGCCAACGTGATGCGGATAACAAAAGCCAAGGTAATGTTCTAGAGCGTCGCCAA 

ERRQRDADNKSQGN VLERRQ 
2021 Re « >eat 12 < SE Q 10 94 ) ( ► 

CGCGATGCGGATAACAAAAGTCAGGGCAATGTTTTAGAGCGTCGCCAACGTGATGCTGAT 
RDADNKSQGNVLERRQRDAD 



10/531651) 



Repeat 3 (SEQ ID 85) 

AACAAAAGTCAGGGCAATGTTCTAGAACGTCGCCAACGTGATGTTGATAACAAGAGCCAA 
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1081 | Repeat 13 (SEQ ID 95) 

AACAAAAGTCAAGGTAATGTTCTAGAGCGTCGCCAACGCGATGCAGATAACAAAAGCCAA 

NKSQGNVLERRQRDADNKSQ 
I Repeat 14 (SEQ ID 96) Repeat 15 (SEQ ID 97) | 

GGTAATGTTCTAGAGCGTCGCCAACGCGATGCTGATAACAAAAGTCAAGGTAATGTTCTA 

GNVLERRQRDADNKSQGNVL 
1 2 0 1 Repeat 16 (SEQ ID 98) | 

GAGCGTCGCCAACGTGATGCTGATAACAAGAGCCAAGGCAATGTTCTTGAGCGTCGTCAA 
ERRQRDA DNKSQGNVLERRQ 

1261 Repeat 17 (SEQ ID 99) ■ ► 

CGCGATGTCGATAACAAAAGTCAGGGTAATGTTTTAGAGCGTCGCCAACGTGATGCGGAT 

RDVDNKSQGNVLERRQRDAD 
1321 | ► Repeat 18 (SEQ ID 100) 

AACAAGAGTCAAGGTAATGTTTTAGAGCGTCGCCAACGCGATGCGGATAACAAGAGCCAA 

NKSQGNVLERRQRDADNKSQ 

I ► Repeat 19 (SEQ ID 101) Repeat 20 (SEQ ID 102) , 

GGTAATGTTTTAGAGCGTCGCCAACGCGATGCGGATAACAAGAGTCAAGGTAATGTTTTA 

GNVLERRQRDADNKSQGNVL 
1441 Repeat 21 (SEQ ID 103) j— ► 

GAGCGTCGCCAACGCGATGCGGATAACAAGAGCCAAGGTAATGTTTTAGAGCGTCGCCAA 

ERRQRDADNKSQGNVLERRQ 
1501 Repeat 22 (SEQ ID 104) . ► 

CGCGATGCAGATAACAAAAGTCAAGGTAATGTTTTAGAGCGTCGCCAACGCGATGCTGAT 

RDADNKSQGNVLERRQRDAD 
1 5 g 1 | ► Repeat 23 (SEQ ID 1 05) 

AACAAGAGCCAAGGTAATGTTTTAGAGCGTCGTCAACGTGATGCAGATAACAAAAGTCAG 
NKSQGNVLERRQRDADNKSQ 

| ^ Repeat 24 (SEQ ID 106) Repeat 25 (SEQ ID 107) | ^ 

GGCAATGTTTTAGAGCGTCGTCAACGTGATGCGGATAACAAGAGCCAAGGTAATGTTTTA 
GNVLERRQRDADNKSQGNVL 

1681 Repeat 26 (SEQ ID 1 08) > ^> 

GAGCGTCGCCAACGTGATGCGGATAACAAGAGCCAGGGCAATGTTCTAGAACGTCGTCAA 

ERRQRDADNKS QGNVLERRQ 
1741 Repeat 27 (SEQ ID 109) | ► 

CGTGATGCGGATAACAAGAGCCAAGGTAACGTTTTAGAGCGTCGCCAACGTGATGCGGAT 
RDADNKSQGNVLERRQRDAD 

1 8 0 1 | Repeat 28 (SEQ ID 1 10) 

AACAAGAGCCAGGGCAATGTTTTAGAGCGCCGCCAACGCGATGCAGATAACAAAAGTCAA 

NKSQGNVLERRQRDADNKSQ 
| Repeat 29 (SEQ ID 111 ) Repeat 30 (SEQ ID 1 1 2) | 

GGTAATGTTCTAGAGCGTCGCCAACGCGATGCAGATAACAAGAGCCAGGGTAATGTTCTA 

GNVLERRQRDADNKSQGNVL 
1921 

GAGCGTCGCCAACGCGATGCGGAAAACAAAAGTCAAGTAGGTCAACTTATAGGGAAAAAT 

ERRQRDAENKSQVGQLI GKN 
1981 
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CCACTTTTTTCAAAGTCAACTGTATCTAGAGAAAATAATCACTCTAGTCAAGGTGACTCT 

PLFSKSTVSRENNHS SQGDS 
2041 

AACAAACAGTCATTCTCTAAAAAAATATCTCAGGTTACTAATGTAGCTAATGGACCGATG 

NKQSFS KKI SQVTNVANGPM 
2101 

TTAACTAATAATTCTAGAACAATTTCAGTGATAAATAAATTACCTAAAACAGGTGATGAT 

LTNNSRTI SVINK L P K T G D D 
2161 ' " ^ 

CAAAATGTCATTTTTAAACTTGTAGGTTTTGGTTTAATTTTGTTAACAAGTCTCTGCGGT 

QNVI FKLVGFGLILLTSLCG 
2221 

TTGAGACGCAATGAAAATTAAGTATAATCAACCATTTAGTAACTATTATAATGATATATG 

L R R N E N * 
2281 ^ < 

CAATCAATAAAAAAGGAATCGAATACGAGATTCCTTTTTATAATTAGGTTGGTTAGGGTG 
2341 2361 2381 

ACTTTTTTCATTTGGCTATTCTTGAAAGTTTATAAAAATGTAGTATAATAGTCACATTAA 
2401 2421 2441 

AATGTTTTGAAAATATTGATGAACAACATCATCAAATAGAGGTCAT 
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GNVLERRQRDAENRSQ (SeqID 204) 
G LSONRDVRENORARE (SeqID205) 
GNVLERRQRDAENRSQ 
G LSONRDVRENORARE 
ANVLERRQRDAENRSQ (SeqID 206) 
GAVLERRQRDAENRSQ (SeqID 207) 
GNALERRQRDAENRSQ (SeqID 208) 
GNVAERRQRDAENRSQ (SeqID 209) 
GNVLARRQRDAENRSQ (SeqID 210) 
GNVLEARQRDAENRSQ (SeqID 211) 
GNVLERAQRDAENRSQ (SeqID 212) 
GNVLERRARDAENRSQ (SeqID 213) 
GNVLERRQADAENRSQ (SeqID 214) 
GNVLERRQRAAENRSQ (SeqID 215) 
GNVLERRQRDAENRSQ (SeqID 216) 
GNVLERRQRDAANRSQ (SeqID 217) 
GNVLERRQRDAEARSQ (SeqID 218) 
GNVLERRQRDAENASQ (SeqID 219) 
GNVLERRQRDAENRAQ (SeqID 220) 
GNVLERRQRDAENRSA (SeqID 221) 
GNVLERRQRDAENRSQ 
G LSONRDVRENORARE 
GNVLERRQRDAENRSQ 
G LSONRDVRENORARE 
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1 

ATTTTTAAGCAATATTTTAAAACATAAAAAAAGAAAAATCAACTACTTAAGCTAATTGAA 
61 

GTATTTCTAAGATAATAAAAAATAAGATTATCAAATAAAAAGAAAAATCATTCAAAAATT 
121 

GGGAAAAAACTTTAAAATTCCATACCTTATAATAAGAAATTATTGATATCATAATAAGTG 
181 

ATAGTTTGTATATTCTAGGATATTCTGTATCTGATCTTAGATTTAGAAACGACATTTCGG 
241 

CACAAT AGGAG TTGTAAAATGAGAAAATACCAAAAATTTTCTAAAATATTGACGTTAAGT 
301 RBS MRKYQKFSKILTLS 
CTTTTTTGTTTGTCGCAAATACCGCTTAATACCAATGTTTTAGGGGAAAGTACCGTACCG 
LFCLSQIPLNTNVLGESTV P 

361 

GAAAATGGTGCTAAAGGAAAGTTAGTTGTTAAAAAGACAGATGACCAGAACAAACCACTT 

ENGAKG KLVVKKTDDQNKP L 
421 

TCAAAAGCTACCTTTGTTTTAAAAACTACTGCTCATCCAGAAAGTAAAATAGAAAAAGTA 

SKATFVLKTTAHPESKI EKV 
481 

ACTGCTGAGCTAACAGGTGAAGCTACTTTTGATAATCTCATACCTGGAGATTATACTTTA 

TAELTGEATFDNLI PGDYTL 
541 

TCAGAAGAAACAGCGCCCGAAGGTTATAAAAAGACTAACCAGACTTGGCAAGTTAAGGTT 

SEETAPEGYKKTNQTWQVKV 
601 

GAGAGTAATGGAAAAACTACGATACAAAATAGTGGTGATAAAAATTCCACAATTGGACAA 

ESNGKTTIQNSGDKNSTIGQ 
661 

AA.TCACGAAGAACTAGATAAGCAGTATCCCCCCACAGGAATTTATGAAGATACAAAGGAA 

NHEELDKQYPPTGI YEDTKE 
721 

TCTTATAAACTTGAGCATGTTAAAGGTTCAGTTCCAAATGGAAAGTCAGAGGCAAAAGCA 

SYKLEHVKGSVPNGKS EAKA 
781 

GTTAACCCATATTCAAGTGAAGGTGAGCATATAAGAGAAATTCCAGAGGGAACATTATCT 

VNPYSSEGEHIREIPEGTLS 
841 

AAACGTATTTCAGAAGTAGGTGATTTAGCTCATAATAAATATAAAATTGAGTTAACTGTC 

KR I SEVGDLAHNKYKI ELTV 
901 

AGTGGAAAAACCATAGTAAAACCAGTGGACAAACAAAAGCCGTTAGATGTTGTCTTCGTA 

SGKTI VKPVDKQKPLDVVFV 
961 

CTCGATAATTCTAACTCAATGAATAACGATGGCCCAAATTTTCAAAGGCATAATAAAGCC 

LDNSNSMNNDGPNFQRHNKA 
1021 
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AAGAAAGCTGCCGAAGCTCTTGGGACCGCAGTAAAAGATATTTTAGGAGCAAACAGTGAT 

KKAAEALGTAVKD I LGANSD 
1081 

AATAGGGTTGCATTAGTTACCTATGGTTCAGATATTTTTGATGGTAGGAGTGTAGATGTC 
NRVALVTYGSDI FDGRSVDV 

1141 

GTAAAAGGATTTAAAGAAGATGATAAATATTATGGCCTTCAAACTAAGTTCACAATTCAG 

VKGFKEDDKYYGLQTKFTIQ 
1201 

ACAGAGAATTATAGTCATAAACAATTAACAAATAATGCTGAAGAGATTATAAAAAGGATT 

TENYSHKQLTNNAEEI I KRI 
1261 

CCTACAGAAGCTCCTAGAGCTAAATGGGGATCAACTACAAACGGACTTACTCCAGAGCAA 

PTEAPRAKWGSTTNGLTPEQ 
1321 

CAAAAGCAGTACTATCTTAGTAAAGTAGGGGAAACATTTACTATGAAAGCCTTCATGGAG 

QKQYYLSKVGETFTMKAFME 
1381 

GCAGATGATATTTTGAGTCAAGTAGATCGAAATAGTCAAAAAATTATTGTTCATATAACT 

ADDILS QVDRNSQKI IVHIT 
1441 

GATGGTGTTCCAACAAGATCATATGCTATTAATAATTTTAAATTGGGTGCATCATATGAA 

DGVPTRSYAINNFKLGASYE 
1501 

AGCCAATTTGAACAAATGAAAAAAAATGGATATCTAAATAAAAGTAATTTTCTACTTACT 

SQFEQMKKNGYLNKSNFLLT 
1561 

GATAAGCCCGAGGATATAAAAGGAAATGGGGAGAGTTACTTTTTGTTTCCCTTAGATAGT 

DKPEDIKGNGESYFL FPLDS 
1621 

TATCAAACACAGATAATCTCTGGAAACTTACAAAAACTTCATTATTTAGATTTAAATCTT 

YQTQI I SGNLQKLHYLDLNL 
1681 

AATTACCCTAAAGGTACAATTTATCGAAATGGACCAGTAAGAGAACATGGAACACCAACC 

NYPKGTIYRNGPVREHGTPT 
1741 

AAACTTTATATAAATAGTTTAAAACAGAAAAATTATGACATCTTTAATTTTGGTATAGAT 

KLY INSLKQKNYDI FNF GID 
1801 

ATATCTGCTTTTAGACAAGTTTATAATGAGGATTATAAGAAAAATCAAGATGGTACTTTT 

ISAFRQVYNEDYKKNQDGTF 
1861 

CAAAAATTGAAAGAGGAAGCTTTTGAACTTTCAGATGGGGAAATAACAGAACTAATGAAG 

QKLKEEAFELSDGEITELMK 
1921 

TCATTCTCTTCTAAACCTGAGTATTATACCCCGATAGTAACTTCATCCGATGCATCTAAC 

SFSSKPEYYTPIVTSSDASN 
1981 
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AATGAAATTTTATCTAAAATTCAGCAACAATTTGAAAAGGTTTTAACAAAAGAAAACTCA 

NEILSKIQQQFEKVLTKENS 
2041 

ATTGTTAATGGAACTATAGAAGATCCTATGGGTGACAAAATCAATTTACAGCTTGGCAAC 

IVNGTI EDPMGDKINLQLGN 
2101 

GGACAAACATTGCAACCAAGTGATTATACTTTACAGGGAAATGATGGAAGTATAATGAAA 

GQTLQPSDYTLQGNDGSIMK 
2161 

GATAGCATTGCAACTGGTGGGCCTAATAATGATGGTGGAATACTTAAAGGGGTTAAATTA 

DS IATGG PNND GG I L KGVKL 
2221 

GAATACATCAAAAATAAACTCTACGTTAGAGGTTTGAACTTAGGGGAGGGACAAAAAGTA 

EYIKNKLYVRGLNLGEGQKV 
2281 

ACACTCACATATGATGTGAAACTAGATGACAGTTTTATAAGTAACAAATTCTATGACACT 

TLTYDVKLDDSFISNKFYDT 
2341 

AATGGTAGAACAACATTGAATCCTAAATCAGAGGATCCTAATACACTTAGAGATTTTCCA 

NGRTTLNPKSEDPNTLRDFP 
2401 

ATCCCTAAAATTCGTGATGTGAGAGAATATCCTACAATAACGATTAAAAACGAGAAGAAG 

I PKIRDVREYPTITI KNEKK 
2461 

TTAGGTGAAATTGAATTTACAAAAGTTGATAAAGATAATAATAAGTTGCTTCTCAAAGGA 

LGE I E FTKVDKDNNKLLLKG 
2521 

GCTACGTTTGAACTTCAAGAATTTAATGAAGATTATAAACTTTATTTACCAATAAAAAAT 

ATFELQEFNEDYKLYLPI KN 
2581 

AATAATTCAAAAGTAGTGACGGGAGAAAACGGCAAAATTTCTTACAAAGATTTGAAAGAT 

NNSKVVTGENGKI SYKDLKD 
2641 

GGCAAATATCAGTTAATAGAAGCAGTTTCGCCGAAGGATTATCAAAAAATTACTAATAAA 

GKYQL I EAVS P K D Y Q * K I TNK 
2701 

CCAATTTTAACTTTTGAAGTTGTTAAAGGATCGATACAAAATATAATAGCTGTTAATAAA 

PILTFEVVKGSIQNI IAVNK 
2761 

CAGATTTCTGAATATCATGAGGAAGGTGACAAGCATTTAATTACCAACACGCATATTCCA 

QISEYHEEGDKHLITNTHIP 
2821 

CCAAAAGGAATTATTCCGATGACAGGTGGGAAAGGAATTCTATCTTTCATTTTAATAGGT 

P K G I I P M T G GKGILSFILIG 
2881 

GGATCTATGATGTCTATTGCAGGTGGAATTTATATTTGGAAAAGATATAAGAAATCTAGT 

GSMMS IAGGIYIWKRYKKSS 
2941 
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GATATATCTAGAGAAAAAGATTAAGAATCATGTGTTTTAGTATTCTTAATTAATTAAATA 
DISREKD* 



TAATTCGAAAGGAGTGGTGCTGCGGTAATATTATAATCCGTATATTATTATCTATGTTGA 
3061 

TTAACTAGAATAAGAAGGAGATAGAAATGAAAAAAATCAACAAATGTCTTACAGTGTTCT 



CGACACTGCTATTGATCTTAACGTCACTATTCTCAGTTGCACCAGCGTTTGCGGACGACG 

STLLLILTSLFSVAPAFADD 

3181 

TAACAACTGATACTGTGACCTTGCACAAGATTGTCATGCCACAAGCTGCATTTGATAACT 

VTTDTVTLHKIVMPQAAFDN 

3241 

TTACTGAAGGTACAAAAGGTAAGAATGATAGCGATTATGTTGGTAAACAAATTAATGACC 
FTEGTKGKNDSDY VGKQ IND 
3301 

TTAAATCTTATTTTGGCTCAACCGATGCTAAAGAAATTAAGGGTGCTTTCTTTGTTTTCA 
LKSYFGSTDAKEI KGAFFVF 
3361 

AAAATGAAACTGGTACAAAATTCATTACTGAAAATGGTAAGGAAGTCGATACTTTGGAAG 
KNETGTKF ITENGKEVDTLE 
3421 

CTAAAGATGCTGAAGGTGGTGCTGTTCTTTCAGGGTTAACAAAAGACACTGGTTTTGCTT 

AKDAEGGAVLSGLTKDTGFA 

3481 

TTAACACTGCTAAGTTAAAAGGAACTTACCAAATCGTTGAATTGAAAGAAAAATCAAACT 

FNTAKLKGTYQIVELKEKSN 

3541 

ACGATAACAACGGTTCTATCTTGGCTGATTCAAAAGCAGTTCCAGTTAAAATCACTCTGC 
YDNNGS ILADSKAVPVKITL 
3601 

CATTGGTAAACAACCAAGGTGTTGTTAAAGATGCTCACATTTATCCAAAGAATACTGAAA 
PLVNNQGVVKDAH I YPKNTE 
3661 

CAAAACCACAAGTAGATAAGAACTTTGCAGATAAAGATCTTGATTATACTGACAACCGAA 

TKPQVDKNFADKDLDYTDNR 

3721 

AAGACAAAGGTGTTGTCTCAGCGACAGTTGGTGACAAAAAAGAATACATAGTTGGAACAA 
KDKGVVSATVGDK KEY I VGT 
3781 

AAATTCTTAAAGGCTCAGACTATAAGAAACTGGTTTGGACTGATAGCATGACTAAAGGTT 
KI LKGSDYKKLVWTDSMTKG 
3841 

TGACGTTCAACAACAACGTTAAAGTAACATTGGATGGTAAAGATTTTCCTGTTTTAAACT 

LTFNNNVKVTLDGKDFPVLN 

3901 

ACAAACTCGTAACAGATGACCAAGGTTTCCGTCTTGCCTTGAATGCAACAGGTCTTGCAG 

YKLVTDDQGFRLALNATGLA 

3961 



3001 



3121 



RBS 



MKKINKCLTVF 
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CAGTAGCAGCTGCTGCAAAAGACAAAGATGTTGAAATCAAGATCACTTACTCAGCTACGG 

AVAAAAKDKDVEIKITYSAT 

4021 

TGAACGGCTCCACTACTGTTGAAGTTCCAGAAACCAATGATGTTAAATTGGACTATGGTA 

VNGSTTVEVPETNDVKLDYG 

4081 

ATAACCCAACGGAAGAAAGTGAACCACAAGAAGGTACTCCAGCTAACCAAGAAATTAAAG 
NNPTEESEPQEGTPANQEI K 
4141 

TCATTAAAGACTGGGCAGTAGATGGTACAATTACTGATGTTAATGTTGCAGTTAAAGCTA 
, VI KDWAVDGT I TDVNVAVKA 
4201 

TCTTTACCTTGCAAGAAAAACAAACGGATGGTACATGGGTGAACGTTGCTTCACACGAAG 
I FTLQEKQTDGTWVNVAS HE 
4261 

CAACAAAACCATCACGCTTTGAACATACTTTCACAGGTTTGGATAATACTAAAACTTACC 
ATKPSRFEHT FTGLDNTKTY 
4321 

GCGTTGTCGAACGTGTTAGCGGCTACACTCCAGAATATGTATCATTTAAAAATGGTGTTG 

RVVERVSGYTPEYVSFKNGV 

4381 

TGACTATCAAGAACAACAAAAACTCAAATGATCCAACTCCAATCAACCCATCAGAACCAA 
VTI KNNK NSND PTP INPS E P 
4441 

AAGTGGTGACTTATGGACGTAAATTTGTGAAAACAAATCAAGCTAACACTGAACGCTTGG 

KVVTYGRKFVKTNQANTERL 

4501 

CAGGAGCTACCTTCCTTGTTAAGAAAGAAGGAAAATACTTGGCACGTAAAGCAGGTGCAG 

AGATFLVKKEGKYLARKAGA 

4561 

CAACTGCTGAAGCAAAGGCAGCTGTAAAAACTGCTAAA.CTAGCATTGGATGAAGCTGTTA 

ATAEAKAAVKTAKLALDEAV 

4621 

AAGCTTATAACGACTTGACTAMGAAAAACAAGAAGGCCAAGAAGGTAAAACAGCATTGG 
KAYNDLTKEKQEGQ EGKTAL 
4681 

CTACTGTTGATCAAAAACAAAAAGCTTACAATGACGCTTTTGTTAAAGCTAACTACTCAT 
AT VDQKQKAYNDAFVKANYS 
4741 

ATGAATGGGTTGCAGATAAAAAGGCTGATAATGTTGTTAAATTGATCTCTAACGCCGGTG 
YEWVADKKADNVVKLI SNAG 
4801 

GTCAATTTGAAATTACTGGTTTGGATAAAGGCACTTATAGCTTGGAAGAAACTCAAGCAC 

GQFEITGLDKGTYSLEETQA 

4861 

CAGCAGGTTATGCGACATTGTCAGGTGATGTAAACTTTGAAGTAACTGCCACATCATATA 

PAGYATLSGDVNFEVTATSY 

4921 
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GCAAAGGGGCTACAACTGACATCGCATATGATAAAGGATCTGTAAAAAAAGATGCCCAAC 
SKGATTD IAYDKGSVKKDAQ 
4981 

AAGTTCAAAACAAAAAAGTAACCATCCCACAAACAGGTGGTATTGGTACAATTCTTTTCA 
QVQNKKVT I P Q T G G I G T I L F 
5041 

CAATTATTGGTTTAAGCATTATGCTTGGAGCAGTAGTTGTCATGAAAAAACGTCAATCAG 
TI I GLS I MLGAVVVMKKRQ S 
5101 

AGGAAGCTTAAGGCTAGTCTTTGATGGTGTATAAGCACAGTTAAAGCTGTGCTTATGATC 

E E A * 

5161 

TAAGGGTATTTCAGTAGAAGTACTCTTAGATCATAAGCAAGAGCCATTATTTAGGAGATG 
5221 

ACGTGAAGACTAAA7\ATATCAACAAAAAAACTAAAAAGAAGAAGTCAAATCTTCCTTTTA 
5281 

TCATTCTTTTTCTAATAGGTCTATCTATTTTATTGTATCCAGTGGTATCACGTTTTTACT 
5341 

ATACGATAGAATCTAATAATCAAACACAGGATTTTGAGAGAG 
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1 

GCTCATGATAATTTATAGAACATTTATAAAATCTTATAATAAACTGGTTAAGTATAGGAA 
61 

ATACTGCATATTTCTTGAAAATATGGTGTATATTGTGAATAAAATGATGACCAAGTTAAT 
121 

TGAATTTTCCTATCGAAAAATTTTTCAAAAAAAATAATTTCACGCTCAAATCATTTGATT 
181 

GTCAAATAAATAGAGCCTTTATAAAAATATTATATAAGTATAAAATGTAAAAAAATAAAA 
241 

AAATGATATTTTTATTTGATTCAAATGTATTTAATAAAAATACAAAGTTTCTAAAAAAGT 
301 

AAAAATTCCATCTCAATAAACAGCGTTAGTTATTATAACCGAACATTATTGTCCTTAAAA 
361 

CATTAAAACAAAAACAAAAGTTCGTAATTTAATTAATTTGTCATGTTACTAATCTTATGC 
421 

TAATATATTATCTCGTGATAAGTTTTTGATGTAAAAATTATCATGAAAAAGAAA AGAGAG 
481 RBS 
ATGGAAATGAAAAAACAATTTTTAAAATCAGCAGCGATTCTATCGCTAGCAGTAACAGCA 
541 MKKQFLKSAAILSLAVTA 
GTATCTACAAGTCAGCCGGTAGCCGGGATAACTAAAGATTATAATAACCGAAATGAAAAA 

VSrSQPVAGITKDYNNRNE K 
601 

GTAAAAAAGTATTTACAAGAAAATAATTTCGGTCATAAAATAGCGTATGGATGGAAAAAT 

VKKYLQENNFGHKIAYGWKN 
661 

AAAGTAGAATTTGATTTTCGTTATTTATTGGATACTGCTAAATATTTAGTAAATAAAGAA 

KVEFDFRYLLDTAKYLVNKE 
721 

GAATTTCAAGATCCTTTATATAATGATGCGCGCGAAGAATTGATAAGTTTTATTTTTCCT 

EFQDPLYNDAREEL I SFIFP 
781 

TATGAGAAATTTTTAATTAACAATCGTGACATAACTAAATTAACAGTTAATCAGTATGAA 

YEKFLI NNRDITKLTVNQYE 
841 

GCGATTGTGAATAGAATGAGTGTTGCTTTACAAAAATTTTCAAAGAATATTTTTGAGAAA 

AIVNRMSVALQKFS KNI FEK 
901 

CAGAAAGTAAATAAAGATTTAATCCCTATTGCGTTTTGGATTGAGAAAAGTTACAGAACT 

QKVNKDLI PIAFWI EKSYRT 
961 

GTTGGAACGAATGAAATCGCCGCTTCTGTAGGCATTCAAGGAGGATTTTATCAAAACTTC 

VGTNE IAASVGI QGGFYQNF 
1021 

CATGATTATTATAATTATTCATATCTATTAAATTCTTTATGGCATGAAGGAAATGTAAAA 

HDYYNYSYLLNSLWHEGNVK 
1081 

GAAGTAGTTAAGGATTATGAAAACACTATTCGTCAAATACTATCTAAAAAGCATGAGATT 

EVVKDYENTIRQILSKKHEI 
1141 
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GAAAAAATTCTTAATCAGAGCACTTCTGATATCTCTATAGATGATGATGATTACGAAAAA 

EKILNQSTSDISIDDDDYEK 
1201 

GGAAATAAAGAATTGCTAAGGGAAAAATTAAATATTATTCTAAATCTTTCAAAGAGAGAT 

GNKELLRE KLNI I LNLSKRD 
1261 

TACAGAGTAACTCCATACTATGAAGTGAATAAACTACATACAGGGCTTATTTTATTGGAG 

YRVTPYYEVNKLHTGLILLE 
1321 

GATGTCCCTAATTTAAAGATTGCTAAGGATAAGTTGTTCTCATTAGAGAATTCTTTAAAG 

DVPNLKIAKDKLFSLENSLK 
1381 

GAATACAAAGGAGAGAAAGTTAATTATGAGGAACTAAGATTCAATACGGAACCTTTAACT 

EYK GEKVNYEELRFNTEPLT 
1441 

AGTTACTTAGAAAATAAAGAAAAATTTTTAGTCCCCAATATTCCATATAAAAATAAATTA 

SYLENKEKFLVPNI PYKNKL 
1501 

ATTTTAAGGGAAGAAGATAAATATAGTTTTGAAGATGATGAAGAAGAGTTTGGAAATGAA 

ILREEDKYSFEDDEEEFGNE 
1561 

CTTCTAAGTTACAATAAGCTTAAGAATGAAGTTTTACCTGTTAATATTACAACTTCTACT 

LLSYNKLKNEVLPVNI TTST 
1621 

ATATTAAAACCGTTTGAACAGAAGAAAATTGTGGAAGATTTTAATCCTTATTCTAATTTA 

ILKPFEQKKIVEDFNPYSNL 
1681 

GACAATTTAGAAATAAAAAAAATAAGGTTGAATGGCTCCCAAAAACAAAAAGTAGAACAG 

DNLEIKKI RLNGSQKQKVEQ 
1741 

GAAAAAACTAAATCGCCAACTCCTCAAAAAGAGACTGTGAAAGAACAAACTGAGCAAAAA 

EKTKSPTPQKETVKEQTEQK 
1801 

GTATCTGGAAATACTCAAGAGGTAGAAAAGAAATCTGAAACTGTGGCAACTTCACAACAA 

VSGNTQEVEKKSE TVATSQQ 
1861 

AGTTCAGTTGCGCAAACTTCTGTCCAACAGCCGGCTCCGGTTCAATCAGTTGTTCAAGAA 

SSVAQTSVQQPAPVQSVVQE 
1921 

TCCAAAGCTTCTCAAGAGGAGATTAATGCAGCACACGATGCTATTTCGGCGTATAAATCA 

SKASQEE I NAAHDAI SAYKS 
1981 

ACAGTCAATATTGCTAATACAGCCGGTGTAACAACTGCGGAAATGACCACGCTCATTAAT 

TVNIANTAGVTTAEMTTL IN 
2041 

ACTCAAACTTCTAATCTTTCTGATGTTGAGAAAGCTTTAGGAAATAATAAGGTTAATAAT 

TQTSNLS DVEKALGNNKVNN 
2101 

GGTGCAGTCAATGTATTGAGAGAAGATACAGCTCGTCTTGAGAATATGATTTGGAATCGT 

GAVNVLREDTARLENMIWNR 
2161 Fig. 17-2 
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GCTTACCAAGCTATTGAAGAATTCAACGTCGCTCGTAATACTTATAATAACCAAATCAAG 

AY Q A I EE FNVARNTYNNQ I K 
2221 

ACAGAAACAGTTCCAGTTGATAATGATATTGAAGCTATTTTAGCAGGTTCTCAAGCTAAA 

TETVPVDNDIEAILAGSQAK 
2281 

ATTAGCCATTTGGACAATCGTATCGGAGCGCGCCACATGGATCAAGCTTTTGTAGCTAGT 

I S HLDNR I GARHMDQA F VAS 
2341 

TTATTAGAAGTTACTGAGATGAGTAAATCAATCTCATCGCGTATAAAAGAGTAGACACTG 

LLEVTEMSKSISSRI KE* 
2401 

CTATCAAGGCGATCTTAAACTTTTGTATTAAACTAACCTAAAAGATAGAAAGAGACTAAT 
2461 RBS 
ATGAAAAAAATAACAACTTTAATCTTAGCTAGTAGCTTATTACTAGTTGCAACGACATCG 

MKKITTLILASSLLL V A T T S 
2521 

GTTAAAGCTGATGATAACTTTGAAATGCCAACGCGTTATGTTAAAATGAGTGAAAAATCA 

VJTADDNFEMPTRYVKMSEKS 
2581 

AAAGCATTTTATCAAAGACTACAAGAAAAACAACGTAAGGCACATACTACTGTGAAGACT 

KAFYQRLQEKQRKAHTTVKT 
2641 

TTTAATAATTCAGAAATAAGGCATCAACTACCTCTTAAACAAGAAAAGGCTAGAAATGAT 

FNNSEIRHQLPLKQE KARND 
2701 

ATCTACAATTTAGGCATTCTTATTTCTCAGGAGTCTAAAGGGTTCATCCAACGTATTGAT 

IYNLGILISQESKGFIQRID 
2761 

AATGCCTATTCTTTGGAAAATGTCTCAGATATTGTTAATGAAGCTCAGGCTTTGTATAAA 

NAYSLENVSDIVNEAQALYK 
2821 

CGTAACTATGATTTATTTGAAAAAATCAAATCTACACGTGATAAGGTTCAAGTCTTACTT 

RNYDL FEKI KSTRDKVQVLL 
2881 

GCATCGCATCAAGATAATACAGACTTAAAAAACTTTTATGCTGAGTTAGATGATATGTAT 

ASHQDNTDLKNFYAELDDMY 
2941 

GAACATGTTTATCTCAATGAAAGTAGAGTGGAGGCGATAAACAGAAATATCCAAAAATAT 

EHVYLNESRVEAINRNIQKY 
3001 

AATTAGTTTCTAAACTAACAAACATTCCTAAATATAAGATATTAAACCCTACTTATTGAT 

N * * 
3061 

TAGTGAGTAGGGTTTTACTGTTTTAAATAGCTTTCTGCTCAGAATGTAAGCCTTGTCATT 
3121 

TCAAAGGAACTATGTTATTATTCTTAAGTAAATTAAATAGGACATTTGGGGTGCGTAACA 
3181 

GCTGAGATTATACCCATTGA 
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